查看原文
其他

分子模拟进入毫秒时代:DE Shaw发布Anton3 快英伟达A100百倍

小王随笔 小王随笔 2023-01-13

前言:

          The night is still young. 夜未央。


2021.11.14DE Shaw 研究所DESRES)的第三代分子动力学模拟超级计算机Anton3论文上线,标志着分子动力学模拟从微秒时代进入毫秒时代


论文标题 <Anton3: Twenty microseconds of molecular dynamics simulation before lunch> [1]

翻译《Anton3:午饭前的20微妙分子动力学模拟》


Anton3 不仅比现有世界最快的分子动力学模拟超算 Anton2 快了10倍以上,更降维打击了世界上所有做分子动力学模拟的科研组、研究所、工业实验室,比使用了通用型 GPU 的超算快了100倍!



上面是分子动力学(MD模拟的性能基准测试图:针对不同大小的模拟体系(含有不同数目的原子)计算超算的模拟效率,即消耗单位物理时间(day)所能获得的模拟时间(μs,微妙)。横轴是模拟体系所含有的原子数:10K ~ 100M;纵轴是模拟时间/物理时间:0.1 μs/day ~ 100 μs/day。对少于100万个原子的较小体系,Anton3(红线)比 Anton2(绿线)快 10+ 倍,比 Anton1(紫线)快 ~100 倍,比 best GPUs(灰色条带)快 100+ 倍;对超过1000万个原子的超大体系,Anton3(红线)比 best 传统超算(绿色条带)快 100+ 倍![2] 


特别注意100万原子所对应的模拟效率:100微妙/天,即 0.1毫秒/天,10天即可获得1毫秒的轨迹。—— 分子动力学模拟的毫秒时代来了!


面对凡尔赛的论文标题和性能基准测试图,小王瞠目结舌,三呼卧槽。自去年12月 AlphaFold2 问世至今,居然在短短一年内如此震惊两次。—— 我们生在好的时代,卷的时代!


本文目录:

  • DE Shaw 的初心
  • Anton 是什么?
  • Anton3 的意义
  • Anton 是什么意思?
  • 对 Anton 的批评
  • 我们呢?
DE Shaw 的初心

DE Shaw,全名 David Elliot Shaw,大卫·艾略特·萧(1951-)。这是一个神人。


这位斯坦福大学计算机系的高材生,1980年博士毕业后拿到哥伦比亚大学的教职,研究大规模并行计算;1986年,涉足金融,加入摩根斯坦利;2年后,创立对冲基金 D. E. Shaw & Co. 开始高频交易,以领先的算法迅速赚取大量利润,家资钜万。


然后,他无聊了。


—— “公司越来越大,钱越来越多,日常管理越来越烦琐,案牍劳形,我感觉自己变得越来越蠢。” [3]


于是,Shaw 每晚回家就找点理论问题解一解,练练脑子。渐渐地,他发现他感兴趣的、想解决的问题越来越大,以至于需要一个团队合力。可惜,他已经不是哥大的教授,没有研究生团队了。


此时,他的一位老朋友,哥大化学教授 Rich Friesner,碰巧在聊天中向他抱怨计算蛋白质折叠的速度太慢。Shaw 说减少循环改进算法嘛,这我熟。拿回去思考一阵后,他提出解决方案将 Friesner 的计算提速了100倍。。。尽管他当时还不太理解问题所涉及的化学和生物,但将他自己的计算机背景加进去就足以做出惊人的改进,大大增强了他的信心。[3]


—— 反正有钱,自己掏钱恁一个团队?


2001年,正逢 Shaw 50岁。过去论天过,现在论秒了。他决定自己出钱,成立 DE Shaw 研究所,招人专门做生物大分子计算。


经过7年, DE Shaw 研究所推出第一代 Anton,将分子模拟从纳秒时代带入微秒时代。举世震惊。


DE Shaw(图片来自 Columbia University)


早在2009年,有人在采访中询问 Shaw,你的计算机如此强大,为什么你只用它做生物大分子的计算?不考虑其它吗?即使是动力学模拟,材料化学、纳米科学也用得上,为什么限制 Anton 的适用范围?


Shaw 回答,他最感兴趣的是将超算应用于生物化学和生物物理,在分子层面理解生命机制,开发相应的工具。这有可能会让人们在某一节点更高效地研发出救命的良药。夜未央,路恒长,前途漫漫待我闯。生物学领域,分子动力学能做的还有很多。[3]


我想,这就是 DE Shaw 的初心吧。


Anton 是什么?

Anton 是一台电脑,一台特殊设计的、功能单一的超级电脑,不是软件


Anton3 的正面和内部布线。[1, 2]


更进一步,Anton 系列超级电脑是仅仅能做分子动力学模拟的超算。在硬件上,它的芯片、主板、布线都由 DE Shaw 研究所(DESRES)特殊设计,目的只有一个:令分子动力学模拟运算得更快。与硬件相匹配的是软件,DESRES 也专门设计了适配 Anton 的动力学模拟软件 Desmond


不同于时下火热的概念:AI + HPC,即人工智能 + 高性能计算,DE Shaw 研究所专注于提高 Anton 的 HPC 能力,重仓分子动力学一条路走到黑了属于是。


Anton3 特殊设计的 CPU die(上图左、下图左)、packaged chip(上图中)、node(上图右、下图右)。[1, 2, 4]


通过特殊设计 CPU 芯片,尽可能减少数据的传输和运算,在芯片上分区域、分精度计算不同任务,突破制约分子模拟速度的瓶颈——原子间相互作用力的计算。


Anton3 的意义


1. 在更接近真实的时间尺度上模拟更大的体系。


Anton3 目前能做到的是在几天内获得的(1)数百万原子体系毫秒级轨迹,(2)超过5000万原子的超大体系亚毫秒级轨迹。这是计算化学完完全全的崭新疆域。[1]


这意味着 Anton3 不仅让分子模拟在时间尺度上跨入毫秒时代,更在空间尺度上迈入病毒时代、细胞器时代!


例如,科学家将能模拟整个 SARS-CoV-2 病毒与ACE2蛋白结合的过程,能够观察药物小分子作为蛋白酶抑制剂(eg. Paxlovid)与靶点蛋白结合,或者观察药物小分子作为逆转录酶抑制剂(eg. Molnupiravir)与病毒的RNA结合。……


风物长宜放眼量,让我们想像更野一些:模拟一个细菌!据估算,全原子模拟一个简单细菌一天(一个生命周期)需要 10^12 ASD 单位算力。[7]


1 ASD = 100 K atoms × 10 μs × 1 day


Anton3 的算力为 120 ASD。那么,Anton3 可以在10天内实现1纳秒的细菌全原子模拟,前提条件是系统能够支撑百亿规模的原子 —— 现在还不行。至少敢想全原子的 whole-organism 模拟了不是?


2. 应用更复杂的、计算更耗时的力场,如极化力场。


制约分子模拟速度的瓶颈是原子间相互作用力的计算;制约分子模拟精度的瓶颈是分子力场多大程度上能近似量子力学。—— 算得快和算得准都取决于分子力场。


常用的分子力场,如 CHARMM、AMBER、GROMOS,是计算精度与计算速度妥协后的结果。也就是说,为了保证速度,还是牺牲了一些精度。


在更强的算力下,可以应用更复杂、更精确、更接近量化计算结果的力场形式,这样能更好地处理诸如质子转移、化学键断裂重组等生化反应。[1]


3. 在庞大的类药分子库中检索潜在的成药分子。


针对耗时不多、体系不大的蛋白-配体结合问题,也就是药物设计中的标靶-药物结合,Anton3 足以在短时间内筛选十亿级别的分子。[1]


如果说 AlphaFold2 令计算在结构生物学领域达到了实验精度,并能引领实验,那么 Anton3 则令计算在生物化学、生物物理学领域比肩实验,实属首次。


Anton 是什么意思?

Anton 这个名字是为了纪念显微镜之父列文虎克Antonie Philips van Leeuwenhoek1632 - 1723)。[3]


DE Shaw 说,Anton 就是一台计算显微镜computational microscope)。我们简单地把要研究的分子放进去,观察它们的运动,不做干预。在此层面,Anton 不是一台超级电脑,而是一台特殊的实验仪器,实现特定的实验功能,令实验员能观察前所未见的对象 —— 与一台显微镜并无本质区别。[3]


社交网络的讨论中存在这样的声音:超长时间的动力学模拟没那么有用,可以用增强采样的方法,更有效率地探索构象空间;并且,粗粒化的模拟也能大大加速计算。


在这里,小王不去争辩孰是孰非。毕竟,增强采样也好,粗粒化也好,没错,很有用。然而,以 DE Shaw 观之,这在某种意义上违背了他的本意。设计 Anton 只是为观察者提供原子级别的观察能力。观察者,当然可以在观察过程中观察对象施加扰动;但想一想列文虎克在他最早的显微镜下观察到游泳的精子、徜徉的细菌、剔透的晶体时是何种心情,又如何行动?他观察;他记录。仅此而已。从所未见的东西,别碰它,记下来,足够。


此外,增强采样通常采纳了一条很强的假设:研究者在探索构象空间时预设了路径,或者说反应坐标。换言之,研究者探索的只是他想探索的一部分。问题来了,你咋预先知道体系沿哪条路径演变?


另一方面,大家也容易明白,巧思各种增强采样等加速运算方法的原因是算力不够。算力够了呢?不必奇巧。速石飘水,大力飞砖。如是。


当然,如果懂得古希腊文,知道 anton 在古希腊文中的意思是无价的、不可估计的(priceless, of inestimable worth),可能会心一笑:Anton 的确是无价之宝。[3]


anti / ἀντἰ   = against 

ṓnios / ὤνιος = for sale  

Ant-on = against sale … 


Anton / DESRES 的批评


没有批评,则赞美没有意义。对 DE Shaw 研究所和 Anton 当然不乏批评:Anton 太稀少了!能获得机会使用 Anton 的人太少了!大佬,收钱吧,批量生产放开了卖吧,咱想买,打钱,on 啊,钱拿走!


不开玩笑,严肃地说。


目前世界上仅有的几台 Anton 分别安置在匹兹堡超算中心(PSC: www.psc.edu/resources/anton/)和位于纽约市的 DE Shaw 研究所(DESRES)。其中,PSC 有一台 Anton1、一台 Anton2;DESRES 有一台或多台 Anton 1 ~ 3。PSC 的 Anton 明说只接受美国学术机构的使用申请,虽然排队,但是免费。


上面我们提到 DE Shaw 的初心是通过加速生物大分子的模拟来推动药物研发,那么为什么不把这一项造福人类的工具推而广之,分而享之,众而乐之呢?哪怕在这个过程中,自己也盈利?


DE Shaw 研究所相当于自己设计、制造却几乎垄断了唯一的实验仪器。这显然也阻碍了科学的进步。悖论吧?


应当让更多人使用 Anton。[4]


我们呢?

AlphaFold2 开源了预测结构的源代码和训练参数的算法,紧接着,国内的众多公司宣布自研算法远远超过、大幅超过 AlphaFold2。小王感到很欣慰 —— 我们的算法团队很强!


小王同样期待,我们的硬件与系统设计团队也展现如此强悍的实力,自研超算,远远超过、大幅超过 Anton3


不调侃了。


说一下我国需要 Anton3 或者类似性能的特种超算的必要性。


上周(2021.11.18),中国团队再次摘得戈登·贝尔奖,将神威·太湖之光(Sunway TaihuLight)应用于“超大规模量子随机电路实施模拟” [5];在最新的世界超算500强榜单上,中国大陆以173台列榜首,远超第2名美国(149台)、第3名日本(32台)、第4名德国(26台),其中前十名中国有其二(第五的神威,第七的天河)[6]。这都标志着我国在超级计算机应用于科学计算方面的进步,和一定程度的领先。


然而,通用型超算尽管算力惊人,在特殊的问题上,其表现未必好过规模小得多(节点数少得多)的执行特种任务的超算。同数量级的领先战胜不了降维打击。



专业/特种超算的好处:

  • 特殊设计,运算速度更快;

  • 功能单一,安装软件单一,维护简单;

  • 用户垂直,机器使用率高、闲置率低。


DE Shaw 团队找到了一个极重要的切入点,或者说赛道吧,把生物大分子模拟这项尤为重要的单一任务,做到了极致。


业界推测:使用 5nm 芯片的 Anton4,3nm 芯片的 Anton5,2nm 芯片的 Anton6 将依次在 2022、2024、2026年推出。[4] 


我个人认为不会有那么快,因为2007年 Anton1(90 nm 芯片)推出后5年,在2012年 Anton2(40 nm 芯片)才公布,而 DE Shaw 团队在2020年方用上 Anton3(7 nm 芯片)。参考这份时间表,可能在2025年左右会推出搭载 3 nm 芯片的 Anton4,2030年之后再发布 Anton5。毕竟 DE Shaw 没有商业化 Anton,Anton 的更新迭代取决于其团队自身的使用需求,而不是市场的竞争压力。当然2031年,DE Shaw 就80岁了,届时 DE Shaw研究所何去何从,会否有新掌舵人,会否改变目前的研究和产业策略,有待观察。


现在,我国的分子动力学超算与 Anton2 相比尚且存在代差;等到 Anton4、Anton5 发布,将分子动力学带入秒时代、细胞器时代、小时时代、细菌时代,我们要坐视吗?分子动力学上日益扩大的差距势必漫溢到药物研发、分子生物学、结构生物学、生物物理学等领域。不可忽视。


以上。

2021.11.25 于深圳


公众号回复“计算显微镜”,可领取Anton3论文、DE Shaw采访等PDF(参考资料 1 ~ 4) 



参考资料

[1] Anton3: Twenty microseconds of molecular dynamics simulation before lunch (2021.11)

[2] Anton3 is a fire breathing molecular simulation beast (2021.9)

[3] A conversation with David Shaw (2009) 

[4] The huge payoff of extreme co-design in molecular dynamic (2021.8) 

[5] awards.acm.org/bell/award-winners

[6] en.wikipedia.org/wiki/TOP500#Fastest_supercomputer_in_TOP500_by_country

[7] Biomolecular Simulations: Methods and Protocols (2019)


推荐阅读
>> 又一位芝大学生死于枪击
>> 时隔14年芝大枪声再起,英才罹难
>> 911二十年:美国公知的反思
>> 以色列是当代纳粹国家

行业观察
>> 纳米孔测序蛋白:昨天、今天、明天
>> 细分赛道,人皆为王
>> 汇编|AlphaFold之于医药研发的意义
>> 打开盲盒:AlphaFold2预测了人类全蛋白质组

硬核技术
>> AlphaFold2所用序列库大超凡

科学史
>> “诺奖值得”系列:蛋白质折叠的分子伴侣诞生记
>> 从David Baker的师承聊聊天和号中文操作系统
>> PDB 50年回顾(下五)2003年诺奖水通道蛋白
>> PDB 50年回顾(下四)Wüthrich&蛋白质的核磁共振解析
>> PDB 50年回顾(下三)ATP合成酶&钠钾泵
>> PDB 50年回顾(下二) 光合作用中心
>> PDB 50年回顾(下一)Klug与晶体电子显微学
>> Protein Data Bank 50年回顾与结构生物学发展(上)

梦幻联动:John Jumper 曾是 DE Shaw 的研究员,合发 Science
>> AlphaFold2领队Jumper奇人
>> 专访 | AlphaFold2是一艘曲率飞船

公众号说明
“小王随笔” @xiaowang_essay 是小王的个人号,内容不垂直,目标不明确。本号的宗旨截取自小王的本科和博士母校的校训:理实交融,益智厚生。由于小王的专业背景,本号的内容主要是:科学、科学史等。鉴于小王的价值观:“天不生教员,万古长如夜”,viva la commune,也可能随性写一些激昂文字。因为小王出生成长于东部地区的一个世俗而传统的老回回 muslim 家族,本号也会关注历史、民族学等。干货私货皆有,凭君自取。


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存